1 Análisis univariado
1.1 Variables cualitativas
1.1.1 Variables relacionadas con la información personal
Se puede observar que en el periodo en el que fue realizada la prueba, había una notoria diferencia en cuanto a la distribución de géneros, ya que hay una mayor cantidad de mujeres, y no una distribución de \(50\%\) hombres y \(50\%\) mujeres, que sería lo esperado en este tipo de pruebas.
Se evidencia una clara mayoría en cuanto a estudiantes sin etnia con un \(91.2\%\), sin embargo hay una porción aceptable de estudiantes con esta característica.
El estado civil del \(83.9\%\) de los estudiantes que presentaron la prueba es soltero, aunque hay una buena porción de estudiantes cuyo estado civil es casado y otros cuyo estado civil es unión libre.
Todas las categorías tienen un número notable de individuos. Se destaca la secundaria completa y la primaria incompleta como los niveles educativos más comunes en los padres de los estudiantes que realizaron la prueba en este periodo, aunque también destaca una cantidad considerable de padres con educación profesional completa.
Como en el caso anterior, el nivel de educación más común es la secundaria completa, aunque en este caso, una buena cantidad de madres tienen como nivel educativo un técnico o tecnológico completo.
Se observa un grupo significativo de padres cuya ocupación es trabajar por cuenta propia, concretamente, un \(30.82\%\) de los padres están en esta categoría. De ahí, las demás categorías no resultan muy destacables.
En el caso de las madres, resalta el hecho de que casi el \(40\%\) trabajan como amas de casa o realizando tareas en el hogar.
Se observa que un grupo grande de estudiantes conformado por el \(35.044\%\) del total de individuos trabaja menos de 10 horas. También resalta el hecho de que hay una cantidad considerable de estudiantes que no respondieron a esta pregunta en el cuestionario, por lo que entran en la categoría desconocido.
1.1.2 Variables relacionadas con la información académica
Hay una clara mayoría de estudiantes que repasaron por cuenta propia, siendo el \(61.7\%\), seguido de una cantidad considerable de estudiantes que no se prepararon de ninguna manera.
Se espera que la mayoría de estudiantes estén cursando semestres avanzandos como séptimo u octavo, sin embargo hay algunos estudiantes que cursan primeros semestres, lo que resulta interesante ya que se supone que se necesita un avance del 75% en el programa académico que se esté cursando para presentar esta prueba.
Resalta la cantidad de estudiantes cuyo grupo de referencia es ingeniería y administración y afines, aunque no es raro debido a la cantidad de ingenierías diferentes que se ofertan en las universidades de todo el país.
La gran mayoría de estudiantes están en un programa cuya modalidad es presencial, siendo este un \(81.5\%\) de todos los estudiantes de la base de datos.
De la misma manera que con la modalidad del programa, la mayoría de estudiantes estudian en una universidad, aproximadamente un \(64.2\%\), seguido de un \(31.1\%\) de individuos que estudian en una institución universitaria. Por otra parte hay una pequeña porción de estudiantes que estudian en una institución tecnológica y en una institución técnica profesional.
1.1.3 Variables relacionadas con la información socioeconómica
Se observa que hay una repartición equitativa de la cantidad de estudiantes en cada uno de los diferentes valores del costo de matrícula. El valor de la matrícula que más resalta es “Entre 2.5 millones y menos de 4 millones” con un \(22.575\%\), seguido por “Entre 4 millones y menos de 5.5 millones” con \(15.988\%\) y el tercer lugar es para quienes pagan “Menos de 500 mil” con \(14.085\%\).
La mayoría de los individuos que presentaron el examen Saber Pro pertenecen a los estratos 2 y 3, un muy bajo porcentaje pertenecen a estratos 5 y 6.
Se observa que la mayoría de los hogares de quienes presentaron el examen Saber Pro sí cuentan con servicio o conexión a intenet, aproximadamente el \(84.4\%\).
Se observa que la mayoría de los hogares de quienes presentaron el examen Saber Pro sí poseen computador, aproximadamente el \(83.6\%\).
Se observa que la mayoría de los hogares de quienes presentaron el examen Saber Pro sí poseen lavadora, aproximadamente el \(80.6\%\).
Se observa que la cantidad de hogares que cuentan con horno microogas es muy similar a la cantidad de hogares que no cuentan con este, ya que los primeros representan el \(44.9\%\) de la población, mientras que los segundos el \(49.6\%\).
Se observa que la mayoría de los hogares de quienes presentaron el examen Saber Pro sí cuentan con servicio cerrado de televisión, aproximadamente el \(69.8\%\); mientras que el \(25.6\%\) no cuenta con este servicio.
Se observa que la mayoría de los hogares de quienes presentaron el examen Saber Pro no poseen automóvil particular, aproximadamente el \(61.4\%\); mientras que el \(32.9\%\) sí posee.
Se observa que la mayoría de los hogares de quienes presentaron el examen Saber Pro no poseen automóvil particular, aproximadamente el \(60.9\%\); mientras que el \(33.2\%\) sí posee.
Se observa que la mayoría de los hogares de quienes presentaron el examen Saber Pro no poseen consola para videojuegos electrónicos, aproximadamente el \(75.4\%\); mientras que el \(18.4\%\) sí posee.
1.2 Variables cuantitativas
El histograma muestra una distribución muy parecida a la normal, resaltando que hay muy pocas pero existentes puntuaciones con puntaje o bien perfecto, o bien con ninguna respuesta correcta.
De la misma manera que con razonamiento cuantitativo, el histograma resulta casi simétrico con algunos datos atípicos representando los peores puntajes y los mejores, siendo estos, de nuevo, el mínimo puntaje posible y el puntaje perfecto en esta área, respectivamente.
Es muy parecido a los componentes anteriores, aunque resalta una barra en los puntajes más bajos, que aunque resulta pequeña, da a entender que en este componente hay una cantidad visible de puntajes que rondan de 0 a 20 puntos.
El histograma ya no presenta una simetria tan marcada, y resaltan las barras más alejadas de la media, mostrando que hay una cantidad visible de personas tanto con puntajes mínimos como con puntajes perfectos.
El histograma resalta respecto a las otras variables debido a un mayor número de puntajes por debajo de 150, que se espera sería la media. Además resalta que hay una cantidad considerable de personas con el puntaje más bajo. En el boxplot también se puede apreciar como en este caso, la mediana no está tan cerca a 150, que sería lo esperado.
La distribución de los puntajes totales, en este caso, también parece asemejarse a una curva normal, lo cual tiene sentido debido al como se diseñan estas pruebas, intentando que tengan una distribución normal con una media teórica de 150 y una desviación estándar de 30 puntos. Cabe resaltar que el mayor puntaje de esta prueba fue 278, mientras que el menor fue 0.